keywords:"stop slova" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"stop slova"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Určení základního tvaru slova Šanda, Pavel ; Burget, Radim (oponent) ; Karásek, Jan (vedoucí práce) Lemmatizace je důležitou procedurou před dolováním v textu v mnoha aplikacích. Proces lemmatizace je podobný procesu stemmingu, s tím rozdílem, že neurčuje pouze kořen slova, ale snaží se slovo převést pomocí metod Brute Force a Suffix Stripping do jeho základního tvaru. Hlavním cílem této práce je prezentovat metody pro vylepšení algoritmů lemmatizace českého jazyka. Obsahem je vytvoření trénovací množiny dat, kterou lze libovolně použít pro studentské i vědecké práce zabývající se podobnou problematikou. Úplný záznam
	Vyhledávání informací v české Wikipedii Balgar, Marek ; Bartík, Vladimír (oponent) ; Chmelař, Petr (vedoucí práce) Tato diplomová práce má za úkol proniknout do problematiky vyhledávání informací a klasifi kace textu. Hlavní výzkum se zde zaměřuje na textová data, sémantické slovníky a hlavně na znalosti odvoditelné z encyklopedií jako je Wikipedie. V této práci je dále popsaná implementace systému pro dotazování, který je vytvořen na základě získaných znalostí. V závěru práce jsou zhodnoceny vlastnosti a případná vylepšení vyhledávače. Úplný záznam
	Aplikace pro sumarizaci textu Mička, Jakub ; Zendulka, Jaroslav (oponent) ; Bartík, Vladimír (vedoucí práce) V této práci jsem se zaměřil na implementaci webové aplikace, která slouží jako prostředek pro automatickou tvorbu souhrnů v anglickém jazyce. Automatická tvorba souhrnů je v řešení prováděna pomocí metody TextRank a Latentní sémantické analýzy. Obě tyto metody jsou vylepšeny o rozpoznávání pojmenovaných entit. Přínosem této práce je zjištění, že využití rozpoznávání pojmenovaných entit u Latentní sémantické analýzy a především u metody TextRank, vede k vytváření kvalitnějších souhrnů. Tato kvalita souhrnů byla ověřena pomocí metrik ROUGE. Úplný záznam
	Vyhledávání informací v české Wikipedii Balgar, Marek ; Bartík, Vladimír (oponent) ; Chmelař, Petr (vedoucí práce) Tato diplomová práce má za úkol proniknout do problematiky vyhledávání informací a klasifi kace textu. Hlavní výzkum se zde zaměřuje na textová data, sémantické slovníky a hlavně na znalosti odvoditelné z encyklopedií jako je Wikipedie. V této práci je dále popsaná implementace systému pro dotazování, který je vytvořen na základě získaných znalostí. V závěru práce jsou zhodnoceny vlastnosti a případná vylepšení vyhledávače. Úplný záznam
	Aplikace pro sumarizaci textu Mička, Jakub ; Zendulka, Jaroslav (oponent) ; Bartík, Vladimír (vedoucí práce) V této práci jsem se zaměřil na implementaci webové aplikace, která slouží jako prostředek pro automatickou tvorbu souhrnů v anglickém jazyce. Automatická tvorba souhrnů je v řešení prováděna pomocí metody TextRank a Latentní sémantické analýzy. Obě tyto metody jsou vylepšeny o rozpoznávání pojmenovaných entit. Přínosem této práce je zjištění, že využití rozpoznávání pojmenovaných entit u Latentní sémantické analýzy a především u metody TextRank, vede k vytváření kvalitnějších souhrnů. Tato kvalita souhrnů byla ověřena pomocí metrik ROUGE. Úplný záznam
	Metody sumarizace textových dokumentů Pokorný, Lubomír ; Očenášek, Pavel (oponent) ; Bartík, Vladimír (vedoucí práce) Diplomová práce se zabývá jednodokumentovou sumarizací textových dat. Část práce je věnována přípravě dat, která je tvořena hlavně normalizací. Uvedeny jsou v ní některé algoritmy stemizace a obsahuje i popis lematizace. Hlavní část práce je věnována Luhnově sumarizační metodě a jejímu rozšíření za pouţití slovníku WordNet. Popsána a implementována byla i Oswaldova metoda. Navrţená a implementovaná aplikace provádí automatickou tvorbu abstraktů za pouţití zmíněných metod. Byla provedena i sada experimentů, kterými byla ověřena správná funkčnost aplikace. Úplný záznam
	Určení základního tvaru slova Šanda, Pavel ; Burget, Radim (oponent) ; Karásek, Jan (vedoucí práce) Lemmatizace je důležitou procedurou před dolováním v textu v mnoha aplikacích. Proces lemmatizace je podobný procesu stemmingu, s tím rozdílem, že neurčuje pouze kořen slova, ale snaží se slovo převést pomocí metod Brute Force a Suffix Stripping do jeho základního tvaru. Hlavním cílem této práce je prezentovat metody pro vylepšení algoritmů lemmatizace českého jazyka. Obsahem je vytvoření trénovací množiny dat, kterou lze libovolně použít pro studentské i vědecké práce zabývající se podobnou problematikou. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English